Reconnaissance d'écriture manuscrite par des techniques markoviennes : une approche bidimensionnelle et générique

نویسنده

  • Sylvain Chevalier
چکیده

We present an approach of the problem of handwriting recognition using hidden Markov random fields and based on a trully bidimensional analysis of the handwriting. The main innovative aspect of this approah is the combination of a windowed analysis of the image, a Markovian modelisation and an implementation of the 2D dynamic programming algorithm that achieves a fast and optimal decoding of Markov fields. Another feature of this study is the development methodology that focuses on a systematic evaluation of the algorithms and parameters. These algorithms are partly taken from techniques of the domain of speech processing and are very generic. This approach is validated on two different applications corresponding to standard public databases. The application of this generic algorithm to a handwritten digits recognition task achieved results similar to the ones of state-of-the-art methods. The application to a handwritten words recognition task showed that this approach can be extended to more complex tasks in a natural way. This work showed that the proposed approach is valid and appears as a candidate standard method for solving various tasks in computer vision. It paves the way for further developments in handwriting recognition and other important enhancements are expected with the use of other principles commonly used in speech and language processing problems. Other tasks such as image segmentation could also benefit from the robustness and the learning ability of our approach.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Exploitation de l'échelle d'écriture pour améliorer la reconnaissance automatique des textes manuscrits arabe

RÉSUMÉ. Les documents manuscrits arabes présentent des défis spécifiques pour la reconnaissance du fait de la nature de l'écriture cursive et d'autres facteurs, comme la taille de l'écriture. Une des plus grandes bases étiquetées des documents manuscrits arabes, la base de données NIST­OpenHaRT inclut de grandes variabilités dans la taille du texte inter et intra mots et lignes. Nous proposons ...

متن کامل

Extraction automatique de champs numériques dans des documents manuscrits

Résumé. Nous décrivons dans cet article une chaine de traitement complète et générique permettant d’extraire automatiquement les champs numériques (numéros de téléphone, codes clients, codes postaux) dans des documents manuscrits libres. Notre chaïne de traitement est constituée des trois étapes suivantes: localisation des champs numériques potentiels selon une approche markovienne sans reconna...

متن کامل

Fusion des connaissances en analyse de documents - Exemples sur des documents d'archives

RÉSUMÉ. La reconnaissance de collections de documents structurés numérisés et notamment de documents d’archives est difficile non seulement par la complexité de l’organisation des documents, mais aussi par la dégradation des documents (tâches, déchirures, encre traversant le papier, courbures produites à la numérisation. . . ). Afin d’améliorer la qualité de la reconnaissance tout en gérant le ...

متن کامل

La Théorie de la Résonance Adaptative et les Moments de Zernike pour la Reconnaissance de Mots Arabes Manuscrits

Résumé. La reconnaissance de l'écriture arabe manuscrite est un domaine de recherche relativement récent et qui a connu ces dernières années des progrès remarquables. Il présente un intérêt indéniable dans l’accomplissement de tâches considérées fastidieuses dans certains domaines comme le tri postal, la lecture de chèques bancaires, la lecture des bordereaux, etc. Ce papier présente la concept...

متن کامل

Système Neuro-Markovien pour la Reconnaissance de l'Écriture Manuscrite Arabe à Vocabulaire Limité

Résumé. Nous proposons une manière de coopérer des MMC et des réseaux neuronaux dans une architecture probabiliste en tirant avantage des deux outils : la génération d’une liste des N meilleures hypothèses de mots ainsi que leurs segmentations en caractères par un classifieur MMC et les propriétés de modélisation des réseaux neuronaux appliquées aux caractères. Le classifieur RN utilise la segm...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2004